网站采集神器:采集文章页评论方法
当前位置: 网站首页 > 网站采集神器:采集文章页评论方法

网站采集神器:采集文章页评论方法

2022年07月22日 02:29:24  来源:心里有数-实操笔记    

网站采集神器:采集文章页评论方法

【评论采集】

1、添加标签,所采集的评论标签名必须为 评论

image.png

数据格式:

1、纯文本。

2、带html代码。

注意事项:在采集时,前者会删除html代码,而后者不会。一般情况下,如果是评论采集,采集“评论”选择 纯文本或者采集“评论”选择 带html代码都可以,根据实际情况看。


评论内容匹配

评论内容匹配支持三种方式:

1、css选择器。

2、前后截取。

3、正则匹配。

注意!这三种方式是三选一,并不是同时有效。


css选择器

在css选择器中基本表示用法:

1、class值,用 . 表示,比如 .article-con,如下图:

2、id值,用 # 表示,比如 #main

3、元素标签直接用标签名表示,比如h1标签,就是 h1

更多用法详见:css选择器参考手册


image.png


定位元素几种简单方法:

1、父元素选择器+空格+子元素选择器 比如:#main .post-title,#main .entry h2 a,.entry .post-title

2、父元素选择器+字元素名+子元素选择器 比如:#main a.post-title,.entry a.post-title

注意事项:如果匹配到了多个评论内容,默认情况下,在入库时,会将这些评论内容依次首位相连合并。


前后截取

必须得有两段文本才能实现截取,开头字符串 和 结尾字符串,并且每个要采集的页面中,都必须包含这些字符,否则将会采集失败。该匹配评论内容的方式仅支持截取一段评论内容。开头字符串 必须是在html源码中第一次出现。注意事项:用作截取的评论内容,可以是任意字符,长度不宜过长。


image.png


排除元素

将已匹配到的评论内容,再次实行内容过滤,这里仅支持css选择器,多个选择器用英文 ,分开。

如果是过滤评论图片,直接在CSS选择器中输入:img  即可。


2、评论入库模块配置:

image.png

3、采集发布评论时,回答用户配置:

image.png

4、全部设置好,即可像采集文章一样开始采集即可。



标签:网站采集神器 


心里有数-实操笔记相关文章

  • iframe嵌入式第三方平台全屏自适应代码

    iframe嵌入式第三方平台全屏自适应代码

    2024/05/09心里有数-实操笔记热度(5)

    iframe嵌入式第三方平台全屏自适应代码:<!DOCTYPE html><html><head>    <meta charset="UTF-8">    <meta id="viewport" name=&...

  • CRM客户关系管理系统报错问题汇总(FACRM)

    CRM客户关系管理系统报错问题汇总(FACRM)

    2024/04/09心里有数-实操笔记热度(39)

    facrmCRM客户关系管理系统报错问题:1、“网络请求出错”主要是因为redis队列问题。“网络请求出错”解决方法如下:1、安装php7.4以上版本的php版本,然后安装扩展“redis”,如下图:2、安装redis队列软件,如下图:...

  • AI智能名片系统

    AI智能名片系统

    2024/03/03心里有数-实操笔记热度(51)

    AI智能名片系统功能特性一、人脉1、创建名片默认推送到人脉,可通过名片行业标签、职位、姓名搜索名片,快速获取销售线索;2、管理员可在后台设置是否推荐名片二、创建名片可在小程序端快速创建名片,可设置名片电话号码、微信号、二维码、推送到人脉等三、创建微官网可在小程序端快速创建微官网、企业图片、企业文字描述等四、创建产品可在小程序端快速创建产品,不限制数量五、创建案例可在小程序端快速创建成功案例,不限制数量六、创建相册可在小程序端快速创建相册...

  • 企业网站开发:iframe嵌入自适应模板,使电脑与移动手机端都正常显示方法(插入优酷视频为例)

    企业网站开发:iframe嵌入自适应模板,使电脑与移动手机端都正常显示方法(插入优酷视频为例)

    2024/02/02心里有数-实操笔记热度(56)

    iframe嵌入自适应模板,使电脑与移动手机端都正常显示方法(插入优酷视频为例)iframe嵌入通用代码,在PC上显示正常,但是在手机端的尺寸有问题,视频太宽以至于显示不全!问题原因:如上图,通用代码里默认使用了height=498width=510的高和宽固定尺寸,这时候视频的尺寸优先执行iframe里的高宽,导致PC正常,手机端视频溢出!解决办法:首先,使用通用代码的时候,复制代码后,要去除代码中的高宽属性,直接删除height=...

  • 企业网站开发:通用自适应幻灯片、轮播图代码

    企业网站开发:通用自适应幻灯片、轮播图代码

    2024/02/02心里有数-实操笔记热度(47)

    来源:https://www.swiper.com.cn/demo/index.html1、分页器轮播图代码<!DOCTYPE html>    <html lang="en">    <head>    <meta&nbs...

  • H5如何实现唤起APP兼容版,h5跳转app打开或者下载解决方案

    H5如何实现唤起APP兼容版,h5跳转app打开或者下载解决方案

    2024/01/13心里有数-实操笔记热度(115)

    场景1:在h5页面上,不管用户是否安装过该app,都直接跳转到应用市场,让用户从应用市场上打开app。思路:这种场景处理比较简单,直接判断判断是android端还是ios端,然后在点击按钮上赋值对应终端的应用市场下载链接就可以了,在微信上打开h5页面时也不用另外处理。跳转之前,系统会默认弹出对话框问是否跳转。下图以ios端打开淘宝为例:safari内打开h5页面微信内打开h5页面具体实现:<!DOCTYPE ht...

  • 企业网站开发:引用第三方ico小图标方法

    企业网站开发:引用第三方ico小图标方法

    2024/01/12心里有数-实操笔记热度(55)

    将要引用的第三方ico小图标CDN资源地址放在网页头部head内,如下代码:<link href="//cdn.staticfile.org/font-awesome/4.7.0/css/font-awesome.min.css" rel="stylesheet" />然后打开网址:https://www.thinkcmf.com/font/search/...

  • 企业网站开发:网站防扒技巧

    企业网站开发:网站防扒技巧

    2023/12/30心里有数-实操笔记热度(65)

    经常我们会发现,我们辛苦搞出来的网站,被别人看上了,扒拉了代码。所以我们就得用到防扒技巧。下面分享的这个方法相当的硬核,当浏览器判断到有人通过F12或者审查元素的行为,浏览器将自动执行关闭当前窗口的行为,并跳转置空白页。具体代码如下:<script type="text/javascript">    //判断F12审查元素  ...

  • 企业网站开发:热门文章、随机文章、随机标签、热评文章通用代码

    企业网站开发:热门文章、随机文章、随机标签、热评文章通用代码

    2023/12/17心里有数-实操笔记热度(149)

    方法一:在include.php中添加,注意修改主题idfunction 主题ID_GetArticleCategorys($Rows,$CategoryID,$hassubcate){global $zbp;$ids = strpos($CategoryID,',') !== false ? explode(',',...

  • 开纸质发票的实操教程
  • AI文章自动化推广系统:首尾段落模版

    AI文章自动化推广系统:首尾段落模版

    2023/12/14心里有数-实操笔记热度(78)

    在AI自动化生成的过程中,经常需要让AI生成不同的文章开头和结尾,所以就需要给AI文章自动化推广系统内置很多不同的首尾段落模版,便于AI应用,为此特别整理了以下参考模版。模板一:最近很多客户问{输入关键词},以及{联想词},所以今天给各位分享{输入关键词}的知识,其中也会对{联想词}进行解释,如果能碰巧解决你现在面临的问题,希望可以对你有所帮助,现在开始吧!模板二:{输入关键词}推荐田文海博客,田文海(tianwenhia.com)专注...

  • AI文章自动化推广系统:文本过滤清洗词库

    AI文章自动化推广系统:文本过滤清洗词库

    2023/12/14心里有数-实操笔记热度(82)

    现在各大平台都开始在打击AI自动化推广系统生成的AI内容了,所以为了更好的提升AI自动化的推广优化效果,特别更新了这个“文本过滤清洗词库”:首先,<=>然而,<=>本文,<=>总结,<=>总结:<=>总结归纳,<=>概述,<=>其次,<=>首先,<=>最后,<=>因此,<=...

心里有数-实操笔记
zblog主题模板
企业管理系统
自动化软件
增值服务
热门Tags标签
友情链接
    2022年07月22日 02:29:24最新发布网站采集神器:采集文章页评论方法文章,主要内容【评论采集】1、添加标签,所采集的评论标签名必须为评论数据格式:1、纯文本。2、带html代码。注意事项:在采集时,前者会删除html代码,而后者不会。一般情况下,如果是评论采集,采集“评论”选择纯文本或者采集“评论”选择带html代码都可以,根据实际情况看。评论内容匹配评论内容匹配支持三种方式:1、css选择器。2、前后截取。3、正则匹配。注意!这三种方式是三选一,并不
已复制微信号

微信号: 6576957
长按二维码保存到手机!

立即添加微信